FILTER MODE ACTIVE

#снижение задержки

Найдено записей: 2

#снижение задержки10.10.2025

ACE — самонастраивающиеся LLM через эволюцию контекстного плейбука, а не дообучение

'ACE' позволяет LLM самоулучшаться через накопительный контекстный плейбук, демонстрируя заметный рост точности и сокращение задержек в задачах агентов и финансовых тестах.

#снижение задержки26.08.2025

Amin: как оптимистичный планировщик ускоряет LLM в 5 раз

'Amin — адаптивный оптимистичный планировщик, который использует нижние оценки длины вывода и упорядоченную эвикцию, чтобы значительно снизить задержки инференса и приблизиться к ретроспективному оптимуму.'